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摘 要 : [目的 /意义 ] 在 线 医疗 社区 用 户 画 像 能 够 精练 化 提取 患者 需求 .可视化 描述 患者 特征 ,有 助 于 平台 管理 者 制定 更 
精准 的 信息 服务 策略 。[ 方法/ 过程 ] 在 梳理 在 线 医疗 社区 用 户 画 像 研 究 成 果 的 基础 上 ,提出 一 种 在 线 医 疗 社区 
用 户 画 像 构建 框架 ,并 人 爬 取 百 度 贴 吧 中 糖尿 病 社区 用 户 数据 ,综合 采用 档案 清单 、 复 合 图 形 、 语 言 描述 和 词 云 方 
法 ,实现 了 具有 4 个 维度 和 12 项 标签 的 在 线 医 疗 社区 用 户 画 像 构 建 。[ 结果 /结论 ] 该 理论 框架 及 实现 方法 有 助 
于 信息 精准 推荐 改善 患者 体验 、 提 升 决策 质量 ,为 在 线 医 疗 社 区 用 户 画 像 构建 与 应 用 提供 了 理论 与 实践 指导 。 
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手 孝 医 和 春雨 医生 等 在 线 医 疗 社区 ( Online Health 
Cemmunity ,OHC) ,它们 将 传统 医疗 服务 转移 到 线 上 环 


bb 


卉 3 并 不 断 重 塑 诊疗 流程 ,包括 医 患 匹配 . 医 患 沟通 和 
个 翌 化 医疗 服务 。 实 现 医生 与 患者 .话题 与 患者 健康 
知 轴 与 患者 等 的 精准 匹配 ,不 仅 能 够 提升 用 户 获取 信 
质量 和 效率 ,还 有 助 于 增强 在 线 医疗 社区 提供 定 


篇 相关 文献 (引文 数据 库 :CNKI; 检 索 日 期 :2020 年 10 
月 31 日 )。 如 张海涛 等 利用 Con Exp 工具 将 用 户 标签 
换算 为 概念 格 ,通过 概念 格 Hasse 图 将 用 户 群 体 分 类 ， 
实现 健康 社区 大 数据 群体 画像 ”。 国 外 对 OHC-UP 研 
究 较 为 重视 ,尤其 是 以 患者 为 中 心 (Patient-Centered 
Design ,PCD ) 的 用 户 画 像 成 为 研究 热点 ,已 建立 基于 
PCD 的 用 户 画像 包括 面向 心血 管 疾病 药物 治疗 者 号 、 
传统 药 用 植物 使 用 者 、 慢 性病 老年 人 呈 等; 工作、 性 
别 ,年龄 IT 经验、 网 站 搜索 能 力 、 身 体 特征 、 认 知 特征 、 
工作 特征 、 生 活 方式 、 社 会 支持 移动 端 使 用 、 使 用 焦 


制服 务 的 有 效 性 。 精 准 匹 配 需要 以 条 目 精细 描述 清 
晰 的 用 户 需求 为 基础 ,从 而 据 此 推送 适宜 的 医生 \ 话 题 
迁 康 知识 。 用 户 画 像 (User Persona ,UP) 作为 一 种 用 
户 需 求 发 现 .匹配 和 建 模 的 新 兴工 具 , 是 面向 在 线 医 疗 
知识 管理 与 服务 中 的 研究 重点 和 热点 。 

UP 是 以 用 户 为 原型 和 中 心 设计 (User-Centered 
Design,UCD )” ,通过 还 原 属 性 特征 和 给 予 场景 描 
述 ” 组 建 的 可 视 化 标签 集合 。 依 托 在 线 医 疗 应 用 程序 
(如 PC 端的 网 页 社区 、 移 动 端的 APP 等 ) 聚 集 的 海量 
数据 ,提炼 用 户 属性 和 构建 用 户 画 像 ,是 在 线 医疗 平台 
精准 化 推荐 和 服务 的 前 提 '"。 国 内 的 在 线 医疗 社区 用 
户 画 像 (“ User Persona in Online Health Community”, 简 
称 “OHC-UP”) 研 究 相 对 较 少 , 除 综述 性 文章 外 仅 有 10 


虑 、 健 康信 息 搜索 等 精细 化 标签 已 成 功 应 用 于 患者 画 
像 ”“。 这 些 患 者 画像 的 应 用 场景 包括 电子 健康 偏 
好 判断 .可视化 诊疗 档案 .个 人 健康 状况 评估 等 。 
但 是 ,上 述 研究 对 OHC-UP 的 构建 方案 缺乏 一 般 性 ,对 
具体 场景 中 应 用 方式 的 解读 还 有 待 丰 富 。 

基于 此 ,本 文 综合 采用 多 种 标签 表达 和 画像 生成 
方法 ,提出 一 种 更 具 一 般 性 的 OHC-UP 构建 框架 ,将 其 
应 用 于 实践 来 增强 研究 的 落地 效力 和 实用 价值 ,并 明 
确 OHC-UP 的 应 用 能 够 解决 何 种 现实 问题 ,以 期 为 完 
善 在 线 医疗 平台 的 知识 服务 提供 参考 和 借鉴 。 


2 在线 医 疗 社区 用 户 画 像 构建 框架 
有 户 提供 医疗 信息 服务 的 网 络 平台 ,本 


OHC 是 为 


en 
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文 主要 讨论 面向 串 有 或 可 能 患 有 某 些 疾病 人 群 的 
OHC-UP。 在 借鉴 现 有 文献 思路 的 基础 上 ,提出 一 
种 具有 一 般 性 的 OHC-UP 构建 框架 ,框架 构建 核心 步 


又 包括 标签 体系 建立 .社区 数据 采集 .用户 画 像 呈 现 。 
如 图 1 所 示 : 


标签 体系 建立 社区 数据 采集 户 画 像 呈 现 
-rg “大 > 
ole 加 | 档案 清音 
社区 数据 相 取 国名 


数据 清洗 加 工 


语 复 
言 合 
描 图 
述 形 

| 羡 
~、 pe 


图 1 在 线 医疗 社区 用 户 画 像 构 建 框 架 


2 外 = 标签 体系 建立 

建立 OHC-UP 标签 体系 的 主要 目的 是 创建 一 种 基 
知 RCD 的 还 原 性 患者 角色 ,作用 是 以 细 分 的 标签 来 控 
据 QHC 患者 的 需求 .愿望 和 障碍 。 基 于 PCD 的 标签 建 
记过 程 的 基本 原则 包括 :@D 将 患者 原型 置 于 设计 中 心 ; 
国 优先 关注 患者 及 其 任务 ; 国 确保 可 用 性 。 基 于 上 述 
号 自 上 而 下 地 建立 OHC-UP 标签 体系 ,包括 标 
性质 层 设计 .标签 凝练 细 化 .标签 表达 规则 三 个 环节 。 
2G3 标签 顶层 设计 


还 原 研究 对 象 。 不 同 于 现 有 研究 仅 关 注 某 个 侧 
面 “… ,本 文 总 结 并 集成 了 OHC 用 户 的 4 个 核心 属性 : 
中 自然 人 属性 。 具 有 确定 的 人 口 学 统计 特征 和 自然 人 
天 然 具备 的 一 切 需 要 ””。@@ 患 者 人 属性 。 信 息 服务 
对 象 是 患 有 或 可 能 患 有 茶 些 疾病 的 人 群 ,需要 根据 发 
病 部 位 、 种 类 和 对 应 科室 等 因素 进行 功能 性 服务 细 
分 "“"。@ 在 线 人 属性 。OHC 赋予 用 户 虚拟 的 角色 和 
身份 ,允许 用 户 展示 与 其 自然 人 真实 身份 相 区 别 的 网 
络 形象 ”。@ 图 社区 人 属性 。 具 有 维系 群体 关系 的 需 


ss 依据 将 患者 原型 置 于 设计 中 心 的 原则 ,标签 项 层 
设 证 需要 以 不 同 侧面 的 .加 以 区 别 的 和 全 方位 的 视角 


wm mp : 
和 2 
一 i 
O 


要 ,自发 产生 一 种 对 社区 群 组 的 依恋 感 ,建立 与 其 他 用 
户 的 人 际 纽带 ”。 如 图 2 所 示 : 
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图 2 在 线 医疗 社区 用 户 核心 属性 细 分 


2.1.2 标签 凝练 细 化 

依据 优先 关注 患者 及 其 任务 原则 ,所 选取 标签 应 
当 具 有 PCD 职能 , 即 为 用 户 提供 帮助 传达 用 户 需 求 、 
用 于 任务 分 析 、 用 于 客户 服务 。 基 于 此 ,本 文 参考 现 有 
文献 的 标签 设计 , 细 化 前 文 4 个 核心 属性 的 下 设 标 签 。 
见 表 1。 

(1) 自然 人 属性 。 姓 名 (或 身份 证 号 ) 是 OHC 用 
户 在 真实 世界 中 的 基本 标识 ,用 于 社区 管理 者 和 其 他 
成 员 识别 和 确认 他 人 真实 身份 ” ;年 龄 ,性别 和 居住 地 


是 基于 人 口 学 特征 细 分 用 户 的 常用 标准 ,可 作为 信息 
推送 (如 医院 信息 、 医 生 信 息 .日常 养 护 建议 等 ) 的 基 
础 参考 依据 六 ;职业 由 在 描述 OHC 用 户 在 现实 生活 中 
以 何 种 方式 获得 收入 以 及 需要 为 此 付出 何 种 劳动 , 便 
于 社区 和 医务 人 员 针 对 性 地 提供 信息 服务 ” ;愿望 
是 OHC 用 户 对 现实 生活 最 为 期 待 的 诉求 ,用 于 社区 管 
理 者 或 医务 人 员 为 患者 提供 核心 关怀 。 

(2) 患 者 人 属性 。 病 种 是 PCD 设计 者 分 类 OHC 
用 户 最 重要 的 标签 ,用 于 对 医疗 健康 信息 服务 作出 功 
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能 性 区 分 ““ ; 患 病 时 间 疾病 危险 性 是 判断 生理 (或 
心理 ) 健康 需求 紧迫 性 的 基本 依据 ,被 看 作 OHC 用 户 
健康 状况 的 描述 -3 。 

(3) 在 线 人 属性 。 昵 称 (或 用 户 四 ) 是 OHC 用 户 
在 虚拟 社区 中 的 基本 标识 ,用 于 社区 管理 者 和 其 他 成 
员 识 别 和 确认 他 人 虚拟 身份 中 ;信息 负载 是 用 户 参 与 
OHC 时 需要 接触 信息 量 的 大 小 ,用 于 表示 OHC 用 户主 
观 上 愿意 投入 于 健康 信息 服务 的 时 间 和 精力 ” ;信息 
偏好 是 OHC 用 户 对 社区 内 各 类 健康 信息 的 喜好 程度 ， 
用 于 支持 推送 系统 针对 个 人 偏好 开展 精准 信息 荐 
闻 

(4) 社 区 人 属性 。 社 交 类 型 站 在 刻画 OHC 用 户 的 
社交 意愿 .需求 和 能 力 , 可 辅助 社区 决定 是 否 应 向 用 户 
推送 社交 信息 及 信息 量 的 多 少 '" ;社会 情感 则 在 识别 
用 高 向 OHC 其 他 成 员 传递 出 何 种 情感 ,是 积极 .消极 
抑或 是 中 立 "。 
LQ) 。 表 1 在 线 医疗 社区 用 户 画 像 标签 体系 


人 CC 有 维度 具体 标签 

eh 然 人 属性 姓名 年龄 性别、 居住 地 ,职业 ,愿望 

C3 入 属性 病 种 、 患 病 时 间 疾病 危险 性 

人 全线 人 属性 昵称 ,信息 负载 .信息 偏好 
区 人 属性 社交 类 型 .社会 情感 


2G4 标签 表达 规则 

_ 会 根据 确保 可 用 性 的 原则 ,需要 明确 表 1 中 OHC 用 
启 标 签 的 具体 表达 方法 和 预期 结果 。 部 分 标签 采用 自 
然 圳 言 梢 述 法 进行 表达 ,直接 从 证 据 性 文本 中 抽取 内 


容 3 妨 表 2。 下 面 着 重 说 明 标 签 的 表达 规则 : 
CD)(1) 病 种 。 为 取得 统一 、 规 范 的 病 种 编码 与 名 称 ， 
将 国际 疾病 分 类 (International Classification of Diseases ， 
ICD) 导入 Excel 数据 库 ,作为 模糊 匹配 用 户 UGC 中 
对 患 病 种 类 描述 的 参照 。 
(2) 疾 病危 险 性 。 病 情 发 展 的 严重 程度 决定 病人 
就 诊 与 处 置 的 优先 次 序 , 如 将 病人 按照 濒危 ,危重 、 急 
症 \ 非 急症 进行 分 流 , 根 据 病 种 按照 低 危 、 中 危 、 高 危 、 
极 高 危 进行 分 级 等 。 

(3) 信 息 偏 好 。 根 据 现 有 文献 的 建议 ,可 通过 用 
户主 页 关注 的 社区 话题 抽取 关键 内 容 , 或 者 提取 用 户 
对 话 数据 中 的 高 频 词 ,来 确定 个 人 信息 偏好 。 

(4) 社 交 类 型 。 现 有 文献 根据 OHC 用 户 社 交 网 络 
的 出 和 人 度 相对 高 低 进行 社交 类 型 区 分 ,认为 和 出 人 度 
数值 分 布 符合 正 态 分 布 ,应 以 3o 原理 作为 判断 依据 ， 
反之 采用 二 八 定律 为 区 分 准则 '" 。 本 文 基于 网 络 节 
点 出 入 度 的 用 户 社 交 类 型 矩阵 ,将 用 户 社交 类 型 划分 


Outdegree 
high 粉丝 型 达 人 型 
low 佛 系 型 贵族 型 
Ind 
low high te 


图 3 基于 网 络 节点 出 入 度 的 用 户 
社交 类 型 矩阵 


(5 ) 社 会 情感 。 朴 素 贝 叶 斯 是 广 为 采 纳 的 情感 分 
析 方 法 ,通过 语料库 训练 情感 分 类 模型 ,判断 患者 社区 
对 话 过 程 中 隐 含 的 情绪 状态 。 
表 2， 在 线 医疗 社区 用 户 画像 标签 表达 规则 


标签 表达 方法 表达 结果 
姓名 自然 语言 描述 法 如 “高 树 新 ” 
年 龄 自然 语言 描述 法 如 “63 岁 ” 
性 别 自然 语言 描述 法 男 / 女 
居住 地 自然 语言 描述 法 如 “北京 ” 
职业 自然 语言 描述 法 如 “演员 ” 
愿望 自然 语言 描述 法 如 “能 看 到 我 孙女 长 大 
和 结婚 ” 
病 种 基于 分 类 的 类 型 范围 (由 评论 ”如 “霍乱 (A00.901)” 
文本 /诊断 图 片 确定 ) 
患 病 时 间 ”自然 语言 描述 法 如 “3 个 月 ” 
疾病 危险 性 ”基于 分 类 的 类 型 范围 (对 疾病 ” 低 危 /中 危 /高 危 / 极 高 危 
发 展 程度 分 级 ) 
昵称 自然 语言 描述 法 如 “飞翔 的 企鹅 ” 
信息 负载 ”评分 量 表 ( 由 平均 活跃 时 长 进 ”天 使 /忠实 /常规 /游客 / 
行 分 级 ) 僵尸 
信息 偏好 ”基于 统计 特征 的 类 型 范围 (由 ”如 “三 鹿 奶 粉 ” 
关注 话题 /评论 文本 确定 ) 
社交 类 型 ”基于 统计 特征 的 类 型 范围 ( 由 达 人 型 /贵族 型 /粉丝 型 / 
网 络 节点 出 入 度 确定 ) 佛 系 型 
社会 情感 ” 评分 量 表 (根据 评论 文本 进行 ” 积极/ 中立/ 消极 
情感 分 析 ) 


2.2 社区 数据 采集 

社区 数据 采集 是 OHC-UP 构建 过 程 中 承上启下 的 
中 间 步 又 ,在 完成 标签 体系 建立 后 ,需要 通过 OHC 数 
据 提 取信 息 , 支持 UP 标签 表达 过 程 。 这 里 将 社区 数 
据 采 集 细 分 为 社区 数据 怜 取 、 数 据 清 洗 加 工 画像 数 据 
准备 三 个 环节 。 
2.2.1 社区 数据 礁 取 

不 同 于 现 有 文献 优先 获取 数据 ,从 而 挖掘 特征 、 提 


149 


团 定 情报 三 作 


第 65 卷 第 12 期 2021 年 6 月 


ChinaXiv 合 作 期 刊 


炼 标签 的 主张 *“ , 即 , 本文 主张 优先 确定 标签 ,按照 
社区 管理 者 需求 ,收集 用 于 表达 特定 标签 的 数据 。 构 
建 OHC-UP 需要 疏 取 的 社区 数据 包括 用 户主 页 数据 、 
用 户 对 话 数据 用户 关注 数据 .用户 诊 疗 数据 。 诚 然 ， 


对 于 OHC 管理 者 则 无 需 疏 取 社区 数据 , 仅 需 从 服务 系 
统 的 后 台数 据 库 中 完成 调 取 工 作 。 但 是 ,厘清 上 述 数 
据 的 描述 内 容 、 应 用 方法 与 UP 标签 的 逻辑 关系 仍然 
是 有 益 的 。 如 表 3 所 示 : 


表 3 ”在线 医 疗 社区 胞 取 用 户 数据 描述 


类 型 主要 形式 可 信和 度 应 用 方法 服务 标签 
户主 页 数据 文本 /图 片 相对 较 低 提取 文本 姓名 ,年 龄 .性别 、 居 住地 、 职 业 、 愿 望 \ 昵 称 \ 信 息 负 载 \ 信 息 偏 好 
有 户 对 话 数据 文本 准确 词 频 分 析 、 情 感 分 析 信息 偏好 、 社 会 情感 
户 关 注 数 据 文本 准确 社会 网 络 分 析 社交 类 型 
和 户 诊疗 数据 图 片 相对 较 高 提取 文本 姓名 ,年 龄 ,性别 .居住 地 、 病 种 、 患 病 时 间 ,疾病 危险 性 


2.2.2 数据 清洗 加 工 

OHC 数据 清洗 和 加 工具 体 包括 "” : @ 吻 除 无 效 
值 ;@ 重 复 项 合并 ;@ 数 据 规范 化 ;@ 关 键 内 容 抽取 。 
经 壕 上 述 数据 处 理工 作 后 ,将 数据 存储 至 合适 的 数据 
席 信 Wl SQL Server) ,形成 初步 数据 集 。 
2 局 画像 数据 准备 
LO 形成 画像 数据 集合 ,还 需要 根据 实际 研究 情况 , 别 
除 疯 步 数据 集中 含有 NULL 值 .可 信和 度 较 低 的 低 质量 
数据 ,确保 OHC-UP 的 任意 项 标签 都 有 相应 的 \ 可 信 的 
区 革 数 据 ,理由 如 下 :@D 不 完全 数据 直接 限制 了 标签 表 


分 的 理论 步骤 开展 实证 检验 ,利用 百度 贴吧 生成 糖尿 
病 吧 社区 的 用 户 画 像 ,进一步 说 明 该 理论 框架 的 可 行 
性 和 应 用 价值 。 
3.1 标签 选择 
根据 百度 贴吧 糖尿 病 吧 社区 用 户 的 数据 特征 ,对 
2.1 节 的 一 般 性 OHC-UP 标签 体系 进行 修正 :中 由 于 
无 法 征求 被 试 者 的 隐私 意愿 ,姓名 标签 因 科研 伦理 限 
制 被 删除 ;@ 由 于 贴吧 用 户 的 职业 为 非 必 填 信息 项 , 职 
业 标 签 因数 据 采 集 限 制 被 删除 。 
最 终 选取 昵称 ,年 龄 ,性别 .居住 地 、 愿 望 , 病 种 上 患 


达 渤 程 ,使 最 终 的 结果 出 现 "残缺" 画像 ;加 现 有 研究 
发 观 用 户 填写 的 个 人 信息 .生成 的 网 络 评论 很 可 能 存 
礁 尖 事实 不 一 致 的 情况 中 。 因 此 ,以 不 完全 数据 或 低 
可 稿 度数 据 构建 OHC-UP, 均 会 降低 画像 的 决策 支持 
能 处 和 社区 管理 者 的 决策 质量 。 故 本 文 所 用 的 画像 数 
据 ( 订 质 上 是 为 满足 研究 者 所 扎 求 的 适宜 粒度 ,过 滤 大 
数据 得 到 的 规模 被 缩减 、 信 度 被 提高 的 优质 数据 集 。 
2 的 用 户 画 像 呈 现 

对 于 OHC-UP 生成 ,本 质 是 运用 预先 准备 的 数据 
集 ,按照 既定 标签 体系 中 的 标签 类 别 、 条 目 及 其 表达 规 
则 , 逐 类 逐 项 地 计算 患者 原型 的 标签 表达 结果 ,赋予 标 
签 信息 ,并 在 完成 全 部 计算 “ 贴 满 "标签 后 ,以 可 视 
化 、 便 于 应 用 乃至 别出心裁 的 画像 建立 最 终结 果 ,为 
OHC 管理 者 或 医务 工作 者 提供 借鉴 和 参考 。 

本 文 构建 了 具有 4 个 维度 和 14 项 标签 的 在 线 医 
疗 社区 用 户 画 像 ,其 中 8 项 标签 采用 自然 语言 描述 法 、 
2 项 标签 采用 评分 量 表 4 项 标签 采用 类 型 范围 描述 。 
该 画像 的 底层 支持 技术 包括 数据 挖掘 .社会 网 络 分 析 
和 情感 分 析 , 呈 现 方式 综合 采用 前 沿 理论 和 广泛 应 用 
的 档案 清单 复合 图 形 .语言 描述 和 词 云 4 种 途径 。 


3 在 线 医疗 社区 用 户 画像 应 用 
本 文 依循 上 述 构建 的 OHC-UP 框架 ,遵循 第 2 部 


病 时 间 ,疾病 危险 性 .信息 负载 .信息 偏好 、 社 交 类 型 、 
社会 情感 共 12 项 标签 。 结 合 糖尿 病 吧 的 具体 社区 特 
征 ,对 标签 表达 规则 作出 如 下 修正 :@ 居 住地 推断 为 就 
诊 医 院 所 在 地 ;@ 患 病 时 间 推 断 为 诊断 报告 时 间 ;@@ 疾 
病危 险 性 参考 患者 描述 .化验 指标 和 辅助 报告 ;四 愿望 
缺乏 证 据 性 文本 时 以 自动 摘要 为 代理 变量 ;@ 以 平 
均 活跃 时 长 作为 信息 负载 的 代理 变量 (平均 活跃 时 长 
为 发 帖 数 与 吧 龄 的 比值 ) ,信息 负载 以 0. 20 为 等 距 区 
间 分 为 5 个 等 级 。 
3.2 数据 采集 

本 文通 过 python 编写 候 虫 代码 , 候 取 2020 年 百度 
贴吧 的 “糖尿 病 吧 ” 主 题 帖 中 参与 用 户 的 主页 数据 和 
发 帖 数 据 。 选 择 百度 贴吧 中 “糖尿 病 吧 ”展开 研究 的 
具体 理由 包括 :拥有 较 大 规模 的 用 户 作为 研究 对 
象 ” ;已 积累 丰富 的 患者 生成 内 容 和 交互 数据 ;@ 
能 够 获取 患者 公开 的 诊疗 材料 的 图 片 ;@ 糖 尿 病 列 入 
中 国 十 大 高 发 疾病 排名 '”;@ 用 户 信 息 行为 数据 具有 
动态 性 和 时 效 性 。 

通过 主页 数据 可 获取 参与 用 户 的 吧 龄 .发帖 数 、 关 
注 帖 .关注 列表 被 关注 列表 ,用 于 计算 信息 负载 .信息 
高 好 、 社 交 类 型 共 3 项 标签 。 见 图 4。 发 帖 数 据 包括 评 
论文 本 (对 话 数据 ) 和 诊断 图 片 (诊疗 数据 )。 评 论文 
本 作为 直接 性 证 据 、 生 成 自动 摘要 或 情感 分 析 的 语 料 ， 


150 


腾 春 娥 ， 何 春雨 . 在 线 医 疗 社区 用 户 画像 构建 与 应 用 [J]. 图 书 情 


用 于 计算 昵称 .愿望 .社会 情感 共 3 项 标签 。 见 图 5。 
识别 并 提取 诊疗 图 片 中 的 关键 内 容 , 用 于 计算 年 龄 .性 
别 \ 居 住地 、 病 种 、 患 病 时 间 ,疾病 危险 性 共 6 项 标签 。 
见 图 6。 按照 2.2.2 和 2.2.3 节 的 方法 对 上 述 数据 作 
进一步 处 理 ,形成 含有 85 条 数据 的 画像 数据 集 。 见 图 
7。 


这 里 对 病 种 .信息 负载 .社交 类 型 的 标签 锚 点 作 必 
要 说 明 :本 文 是 首 篇 将 国际 通用 的 疾病 编码 类 目 引 入 
OHC-UP 研究 的 文献 ,糖尿病 (E10-E14) 包 括 胰岛 素 依 
赖 型 非 胰岛 素 依 赖 型 .营养 不 良 相关 性 、 其 他 特 指 、 未 
特 指 5 个 类 目 ' ,操作 性 标准 包括 年 龄 .体型 . 酮 症 酸 
中 毒 .胰岛素 治疗 效果 、 其 他 指标 和 疾病 报告 等 , 故 本 
虽 以 糖尿 病 社 区 用 户 为 数据 来 源 ,被 试 者 的 病 种 却 
并 末 是 完全 同 质 的 。 其 中 ,E10 为 胰岛 素 依赖 型 糖尿 
病 5 开 11 为 非 胰 岛 素 依赖 型 糖尿 病 ,El12 为 营养 不 良 相 
闫 性 糖尿 病 ， E13 为 其 他 特 指 的 糖尿 病 ,E14 为 未 特 指 
的 稀 尿 病 。 

己 根 据 画像 数据 计算 全 体 用 户 的 信息 负载 指标 , 降 
序 确 定 锚 点 啤 呀 皮 大 * (Order = 17 , 发 帖 数 为 2 817 ， 
哑 哈 为 6.5) 、 破 昵称 真 难 * (Order = 34 ,发 帖 数 为 
1 dg7 , 吧 龄 为 8.6) 、 王 老实 我 没 * (Order =51 ,发帖 数 
96， 吧 龄 为 4) 、 清 椅 白 * (Order = 68, 发 帖 数 为 
1 和 4 3 汉 龄 为 7.9) .请 叫 我 刘 总 * ( Order = 85 ,发 帖 数 为 
3, , 晤 龄 为 6 7) ,得 出 天 使 .忠实 常规、 游客 .僵尸 用 户 
的 所 属 区 间 依 次 为 ( + o ,433.38] 、(433.38,139.19]、 

(189. 19 ,49.00] 、(49.00,15.70] 和 (15.70,0.00]。 
-三 按照 文献 要 求 的 划分 方法 ,计算 本 文 用 户 社交 类 
型 的 所 属 区 间 "” 。 当 F(x<%。) <0.8 时 ,选取 xu 作为 
分 界线 ,确定 入 度 销 点 为 迪 卡 农 * ( 入 度 为 116, F(x 
116) <0.8) 和 的 记 * (入 度 为 119 ,F(x 宇 119) <0.2)， 
出 度 锚 点 为 的 记 * (出 度 为 43 ,F(x<43) <0.8) 和 
fyudlts007 * (出 度 为 44,F(x 宇 和 ) <0.2) ,得 出 in-de- 
gree >116 日 out-degree > 43 为 达 人 型 .in-degree > 116 
有 日 out-degree < 44 为 贵族 型 .in-degree < 119 且 out-de- 
gree >43 为 粉丝 
为 佛 系 型 。 
3.3 画像 呈现 
本 文 创建 OHC-UP 应 用 设计 的 模型 实例 ,提供 了 
一 种 编码 和 识别 用 户 配置 和 角色 属性 的 信息 系统 。 限 
于 篇 幅 ,本 文 仅 报告 两 则 实例 , 见 图 8 和 图 9。 不 同 于 
现 有 OHC-UP 文献 的 采纳 标签 和 呈现 设计 ”” ,本 文 
补充 了 公众 的 内 部 心理 力量 、 外 部 社会 力量 对 医疗 保 
健 选择 和 结果 的 影响 。 这 使 本 文 扩展 了 传统 的 人 


型 .in-degree < 119 日 out-degree < 44 
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图 6 “糖尿 病 吧 ” 用 户 诊断 图 片 


物资 料 和 个 体 属 性 中 未 曾 设计 的 角色 参考 ,包括 :中 愿 
望 , 通 过 基于 句子 的 文本 生成 摘要 体现 PCD 对 利益 相 
关 者 的 核心 关怀 ” ;@ 疾 病 /糖尿 病 检 测 和 诊断 ,根据 
患者 提供 的 医学 报告 提取 病 种 、 病 情 等 信息 ,并 利用 
ICD 编码 将 疾病 /糖尿 病 的 类 型 具体 化 ;@) 信 息 服务 , 通 
过 词 频 统 计 掌 握 并 排序 用 户 有 限 的 兴趣 爱好 和 关注 议 
题 ; 由 社会 支持 网 络 ,对 主页 的 关注 数据 进行 社会 网 络 
分 析 构 建 患 者 网 络 ,明确 不 同 患者 差异 化 的 社交 需求 
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9 被 试 者 “Shengxing * ”OHC-UP 实例 


在 OHC-UP 应 用 过 程 中 ,可 视 化 技术 增强 了 吓 
原型 和 角色 特征 的 呈现 效果 。 整 体 设计 采用 C. Ler 
ouge 等 推崇 的 档案 清单 ,学 者 认为 档案 清单 是 在 公 
众 普及 医疗 保健 技术 背景 下 ,被 管理 者 广泛 接纳 的 捕 


提 、 设 计 和 开发 用 户 特征 的 增强 型 人 物 工具 ;印象 设计 
采用 V. Haldane 等 推崇 的 复合 图 形 ” ,以 适合 阅读 者 
认 知 结构 .易于 理解 与 推测 快速 捕捉 关键 特征 与 细 
节 利于 养 成 短期 记忆 的 图 形 组 合 旺 现 OHC 用 户 社交 
类 型 等 重要 标签 。 通 过 语言 描述 和 词 云 辅 以 常规 设 
计 , 语 言 描述 是 UP 呈现 模式 中 最 直接 的 信息 反馈 手 
段 , 它 将 凝练 后 的 关键 特征 和 证 据 性 文本 ,利用 平 铺 直 
叙 、 最 具 说 服 力 的 方式 予以 展示 " ,而 词 云 可 更 好 地 体 
现 用 户 信息 偏好 中 的 主题 范围 及 其 位 序 ” 。 

相 比 于 现 有 研究 ,本文 在 画像 标签 上 扩 至 12 
项 ,在 生成 方式 上 扩展 至 4 种。 本 文 OHC-UP 较 好 的 
呈现 效果 还 得 益 于 优质 的 画像 数据 集 。 现 有 决策 理论 
表明 , 当 决 策 条 件 繁多 而 复杂 时 ,决策 者 即使 付出 更 多 
的 努力 也 未 必 能 得 出 最 优 决策 ”。 某 种 程度 上 ,基于 
本 文 数据 的 画像 由 于 粒度 和 复杂 程度 均 相 对 适中 , 具 
有 更 强 的 决策 文 持 能 力 。 知 将 画像 数据 集 扩 展 为 原始 
数据 集 ,并 不 影响 本 文 OHC-UP 应 用 设计 的 实现 ,而 只 
是 在 生成 结果 中 出 现 含有 空白 标签 的 实例 。 


4 ”结果 分 析 和 启示 


OHC-UP 的 成 功 实施 和 推广 ,很 大 程度 上 取决 于 
社区 服务 提供 者 的 认 知 ”" 。 这 意味 着 要 使 患者 成 功 
地 对 社区 及 其 信息 服务 产生 依赖 ,开发 人 员 必 须 认识 
到 ,采用 OHC-UP 的 关键 是 服务 提供 者 和 服务 对 象 的 
接受 , 即 采 用 OHC-UP 应 有 应 用 价值 ,患者 有 愿望 让 开 
发 人 员 使 用 该 技术 提供 信息 服务 ”。 故 本 文 结合 生成 
的 OHC-UP 实例 ,详细 阐释 如 何 通 过 OHC-UP 场景 应 
用 ,满足 信息 精准 推荐 .改善 患者 体验 提升 决策 质量 
的 社区 实践 需求 。 

4.1 信息 精准 推荐 

两 则 OHC-UP 实例 中 ,“ 如 暴 如 惑 * ”是 一 例 低 危 
型 营养 不 良 相关 性 糖尿 病 患者 、 高 信息 负载 水 平 的 天 
使 用 户 ,“Shengxing * ” 则 是 一 例 高 危 型 胰岛 素 依 赖 型 
患者 、 中 信息 负载 水 平 的 常规 用 户 。 若 为 上 述 用 户 荐 
阅 参考 性 就 诊 信息 和 专业 性 康 养 知识 ,在 信息 类 型 和 
内 容 上 ,前 者 需要 关注 主题 应 聚焦 于 引发 其 糖尿 病 的 
其 他 疾病 ,建议 其 就 近 就 医 , 而 后 者 更 适合 获悉 有 效 降 
糖 .饮食 控制 .运动 计划 等 诊疗 方案 ,应 考虑 在 权威 医 
疗 系统 及 早 就 诊 ;在 信息 体 量 和 频率 上 ,前 者 更 适合 提 
供 高 信息 体 量 和 频率 的 推送 服务 ,而 后 者 却 可 能 会 对 
繁多 的 信息 和 推送 产生 厌倦 情绪 。 

相 比 于 现 有 画像 文献 的 推荐 模式 ”” ,本 文 提供 
了 更 加 丰富 的 标签 ( 病 种 .疾病 危险 性 .信息 负载 等 ) ， 
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从 而 服务 于 信息 精准 推荐 。 从 信息 角度 来 看 ,OHC 信 
息 服务 被 要 求 给 予 更 多 的 个 性 化 关注 , 且 技 术 工 具 的 
使 用 有 助 于 节省 其 捉襟见肘 的 资源 (如 时 间 )"”"。 
本 文 的 OHC-UP 作为 一 种 信息 系统 , 它 输 出 的 用 户 档 
案 清 单 能 够 高 效 地 呈现 出 用 户 必要 的 个 性 化 关注 和 反 
馈 。 同 样 地 ,这 也 阐明 了 OHC-UP 如 何 能 够 并 且 应 该 
作为 社区 管理 者 为 患者 提供 精准 信息 服务 的 重要 工 


4.2 改善 患者 体验 


两 则 OHC-UP 实例 中 ,“ 如 暴 如 惑 * "是 一 位 爱好 
社交 .情绪 低落 的 青年 男性 , 伴 有 痛风 ,焦虑 症 和 净 滋 
病 等 疾病 ,社区 应 为 其 荐 阅 饲 养 鸟 类 宠物 的 有 趣 资讯 、 
其 他 病友 成 功 对 抗 疾病 的 治疗 案例 等 信息 ,引导 其 
乐观 的 社区 成 员 发 展 有 益 的 互动 关系 ;“ Shengxing *” 
则 巷 一 位 淡泊 社交 ,情绪 中 立 的 中 年 男性 ,是 爱好 徒 
天 养 植 . 诗 词 ,收藏 的 发 烧 友 , 应 通过 社区 服务 放大 其 
徒 曙 兴趣 ,并 及 时 通知 近期 关于 植物 .诗词 和 收藏 的 展 
贤 芍 等 线 下 活动 , 尽 可 能 增加 该 患者 的 运动 需求 和 外 
出 壮 愿 。 

目 比 于 现 有 画像 文献 的 服务 理念 “” ,本 文 更 加 
杜 铀 对 患者 的 人 本 关怀 ,特别 是 不 同性 别 、 年 龄 段 和 并 
发 和 等 患者 的 社交 与 情绪 状况 。 从 患者 角度 来 看 , 串 


社区 运作 决策 ,而 是 选择 了 基于 患者 获取 服务 目标 的 
核心 愿望 挖 所 、 用 户 初 囊 决 定论 的 社区 运作 决策 。 个 
人 偏好 具有 一 定 的 复杂 性 ”” ,管理 者 基于 这 种 考量 可 
能 产生 不 止 一 个 片面 性 的 错误 认 知 。 考 虑 个 人 偏好 的 
服务 策略 有 时 并 不 是 有 效 的 ,只 有 通过 “ walking in 
their shoes” (一 种 西方 学 者 的 隐喻 ) ,真正 为 用 户 设计 ， 
才能 化 解决 策 团队 意见 冲突 。 本 文 OHC-UP 在 充分 
捕 提 用 户 特征 的 基础 上 ,重视 用 户 渴望 的 核心 关怀 ,有 
助 于 决策 者 对 用 户 的 心智 产生 交换 性 认 知 。 


S 结语 


在 线 医疗 社区 是 互联 网 赋 能 医疗 服务 业 而 产生 的 
新 业态 ,实践 界 迫 切 地 需要 学 者 设计 和 开发 辅助 技术 ， 
更 好 地 协助 社区 管理 者 为 患者 提供 信息 服务 。 在 理论 
层面 上 ,本 文 析 出 了 OHC-UP 构建 框架 ,从 标签 体系 建 
立 \ 社 区 数据 采集 ,用户 画像 呈现 三 个 核心 步骤 ,阐释 
了 OHC-UP 构建 过 程 的 底层 逻辑 与 实现 机 制 , 并 细 化 
出 具体 的 一般 性 、 可 复制 的 操作 环节 ,该 理论 框架 为 
在 线 医疗 社区 用 户 画 像 构建 与 应 用 提供 了 理论 依据 和 
方法 指导 。 在 实践 层面 上 ,本 文 仆 取 百度 贴吧 中 糖尿 
病 社 区 用 户 数据 ,综合 采用 档案 清单 .复合 图 形 .语言 
描述 和 词 云 ,实现 了 具有 4 个 维度 和 12 项 标签 的 在 线 


以 往 遇 有 益 于 调节 身心 健康 和 具体 疾病 的 集中 和 感 兴 
越 旺 信号 和 机 会 。 即 患者 可 以 获得 多 种 其 他 信息 源 ， 
但 总 信息 源 的 相对 质量 和 可 靠 性 有 待考 证 ,而且 
发 现 的 信号 和 机 会 与 自身 疾病 基本 没有 相关 性 。 故 除 
用 阿 的 自然 人 和 患者 人 属性 之 外 ,本 文 的 OHC-UP 还 
关注 了 在 线 人 和 社交 人 属性 ,通过 多 维度 属性 融合 的 
关联 特征 挖掘, 为 患者 提供 与 自身 疾病 非 直接 相关 却 
有 益 的 信息 服务 ,激活 其 社交 驱动 的 兴趣 和 保健 行为 。 
4.3 ”提高 决策 质量 

两 则 OHC-UP 实例 中 ,二 者 的 愿望 有 较 大 区 别 ， 
“如 蝶 如 惑 * "陈述 了 疾病 对 个 人 心理 状态 带 来 的 巨 
大 困扰 “Shengxing * " 则 表达 个 人 对 健康 饮食 的 向 往 
和 对 非 健康 饮食 的 警 诚 。 事 实 上 ,社区 管理 者 能 够 根 
据 用 户 愿 望 来 推测 其 深层 次 的 心理 特征 7 , 故 前 者 其 


医疗 社区 用 户 画 像 ,论述 了 本 文 OHC-UP 在 构建 框架 
和 实现 方法 的 可 行 性 和 应 用 价值 ,以 及 它 能 应 用 于 何 
种 场景 .解决 何 种 问题 。 

以 下 内 容 对 弥补 本 文 局 限 具有 重要 价值 ,包括 :中 
OHC 服务 对 象 是 具有 健康 信息 需求 的 人 群 ,多 以 患者 
为 核心 客户 和 流量 来 源 ” 。 本 文 对 上 述 社区 具有 和 较 
好 的 适用 性 和 应 用 价值 , 却 不 适用 于 以 医生 为 核心 客 
户 的 OHC ,未 来 应 针对 较 小 众 的 在 线 医生 社区 开展 UP 
研究 ;@ 实 证 部 分 未 能 排除 A. 本 MeLeod 和 J G. Clark 
等 学 者 的 担忧, 即 OHC 实际 操作 系统 用 户 可 能 与 假定 
为 主要 用 户 的 人 不 同 ” ,可 能 存在 家 属 、 公 益 人 十 等 
代为 生成 社区 内 容 ( 如 帖子 .诊断 图 片 ) 的 情况 ,需要 
研究 者 提供 适合 的 识别 技术 和 算法 ;(3 未 来 应 对 病 种 
标签 的 ICD 编码 作 精 细 化 处 理 ,扩展 为 疾病 类 目的 亚 


实 是 更 淘 望 OHC 服务 给 予 更 多 来 自 社会 的 正 外 部 性 
(如 鼓励 .安奈 和 频繁 的 互动 等 ) ,而 后 者 看 似 是 致 力 
于 饮食 计划 的 改善 ,本 质 上 却 是 对 个 人 兴趣 的 扩展 与 
激活 (如 对 诗词 . 腾 卓 植物 、 奇 石和 陨石 的 欣赏 等 ) 。 

相 比 于 现 有 画像 文献 的 决策 思维 *“ ,本 文 不 同 
于 基于 患者 心理 与 行为 特征 挖掘 ,用 户 习惯 决定 论 的 


目 、 细 目 高 阶 分 类 的 四 、 五 位 数 编码 ,提供 更 具有 针 

对 性 的 诊疗 保健 服务 。 
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Abstract: | Purpose/significance | Online health community (OHC) user persona( UP) can concisely extract 


the needs of patients, visually describe the characteristics of patients, and help platform managers to formulate more 


accurate information service strategies. | Method/ process | On the basis of combing OHC-UP research results, this 


paper proposed a construction framework of OHC-UP, crawled the user data of diabetes community in Baidu Post 


Bar, and comprehensively used file list, composite graphics, language description and word cloud to realize OHC-UP 


with 4 dimensions and 12 labels. | Result/conclusion | The theoretical framework and implementation method are 


helpful for accurate information recommendation, improving patient experience and improving decision-making quali- 


ty, and provide theoretical and practical guidance for construction and application of OHC-UP. 
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